查看原文
其他

湖仓一体架构构建与平台应用实践(PPT)

数据学堂 2022-11-08

数据仓库适合存储结构化的、信息密度高的、经过处理后的数据。例如我们通过大数据分析得到的关联信息、画像信息等,都可以放在数据仓库中。


“仓库”一词也将它的特点表现得清清楚楚。仓库,东西要放在规整的货架上,甚至还会给货架编号。这里的数据很规范,用起来没那么灵活。


数据湖适合存储非结构化的、信息密度低的、未经清洗的数据。例如生产中我们获取到的日志信息、长文本信息等都可以直接放到数据湖中。


曾经有一段时间,大家对于大数据的存储形式分裂为了两派。不断询问是选择数据湖,还是选择数据仓库?


选择数据湖,才能拥有数据的多样与灵活,有利于将不同的数据组合在一起,发现新的规律。选择数据仓库,才能拥有数据的规范与清晰,有利于数据的便捷使用,也利于数据的长时间存储。


湖仓一体,即打通数据仓库和数据湖两套体系,让数据和计算在湖和仓之间自由流动,从而构建一个完整的有机的大数据技术生态体系。这就像是在你的面前放了一个摆满了文档的书桌(数据湖),也放了一个小书架(数据仓库)。于是两者的数据以随意获取,在灵活与规范之间取得了平衡。



下面这份PPT材料来自DAMA中国,专题分享活动《湖仓一体,构建企业数字化新基座》,作者数据科学家毛亮坚老师,主要介绍了大数据平台架构演进、详细阐述湖仓一体架构构建与探索思路、湖仓一体化平台应用实践案例、最后提出了湖仓一体化平台未来发展趋势,推荐给大家阅读。

更多数据仓库相关学习材料请点击文末左下角阅读原文获取。

下面开始进入正文(添加文末歪老师微信好友可获取下方PPT)

<END>


大家都在看:
1、政务数据治理与数据质量管理
2、数据管理平台建设方法论3、华为数字化转型:从战略到执行(PPT)4、企业IT数据架构规划方案(PPT)5、数据标签的分类、设计及实现方法6、9000字详解企业大数据项目规划落地实施路线图7
30页PPT读懂DAMA-DMBOK2.0数据管理知识体系指南核心精要8标签画像体系应用与建设方法(PPT)
9、8000字详解银行业数据治理架构体系搭建10、网易数据治理大赛:数据管治建设实践11、企业数据资产盘点原则与方法12、
基于企业服务总线的主数据管理系统(MDM)集成方案
13、
数据仓库架构、模型、调度、指标建设方案(PPT)
14、
主数据管理解决方案(PPT)
15、
指标管理与元数据管理平台



数据学堂


欢迎扫码添加歪老师个人微信(data-school),邀请加入数据学堂数据治理专业微信群,与业内大咖一起识数据、存数据、管数据、治数据、用数据!


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存